iT邦幫忙

2019 iT 邦幫忙鐵人賽

DAY 13
0
自我挑戰組

R語言-繪圖的極限!系列 第 13

R語言-繪圖的極限! Day-13 打擊率跟上壘率到底有多相關呢?

  • 分享至 

  • xImage
  •  

10月27日台北天氣微涼

既然由散布圖可以得知打擊率及上壘率是息息相關的~

那本篇我們就用回歸分析來看看到底有多相關吧!!

首先接續昨日的圖

#把每一隊皆用一種顏色表示
ggplot(A,aes(x = A$AVG , y = A$OBP )) + geom_point(aes(color = A$Team),size = 4)+
  labs(x = "平均打擊率",y = "平均上壘率",title = "2012 MLB")+
  xlim(c(0.233,0.275))+
  ylim(c(0.294,0.338))+
  geom_smooth(method = lm)

https://ithelp.ithome.com.tw/upload/images/20181026/20112574dQhdvFmCCX.png

我們可以看到兩者呈現正相關,但要如何以數據來說明呢?
這時候我們使用R語言中的回歸

#迴歸分析
lm(應變數~自變數)
W = lm(A$OBP~A$AVG,data=A)
summary(W)

結果如下 :
https://ithelp.ithome.com.tw/upload/images/20181026/201125744whc3y4nn5.png

稍微解釋一下

由圖可以得知 我的自變數 X = 打擊率 , 應變數 Y = 上壘率

其方程式 : Y = 0.78434X + 0.11935

R^2 = 0.7674

代表著其實這兩者的關係是非常密切的!

如果我們要看這條方程式是不是可以合理解釋這兩個變數 , 我們可以藉由第一個紅框中的第二排最後的 梅花 * 來看

其梅花越多代表著解釋力越強

可能解釋的不太好,如有大大有更棒的解釋請不吝賜教拉 XD

End.


上一篇
R語言-繪圖的極限! Day-12 ggplot 用顏色來區分各MLB隊伍
下一篇
R語言-繪圖的極限! Day-14 ggplot 如何加上輔助線呢?
系列文
R語言-繪圖的極限!30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言